叙事中的事件可以通过其参与者的基本状态理解为一致的整体。通常,这些参与者在叙述中没有明确提及,而是通过常识性或推论填写。理解叙述的模型应该能够推断出这些隐性参与者状态,以及有关这些状态对叙事的影响的原因。为了促进这一目标,我们介绍了一个新的众包参与者指出的数据集意大利面。该数据集包含有效的,可推断的参与者状态;对国家的反事实扰动;如果反事实是真实的,那么故事的变化将是必要的。我们介绍了三项基于州的推理任务,这些任务测试了一个故事何时由故事启用,修改一个反事实状态的故事,并解释给定经过修订的故事的最有可能的状态变化。我们的基准测试实验表明,尽管当今的LLM能够在某种程度上推理有关州的推理,但仍有很大的改进空间,这表明了未来研究的潜在途径。
translated by 谷歌翻译
Increasingly taking place in online spaces, modern political conversations are typically perceived to be unproductively affirming -- siloed in so called ``echo chambers'' of exclusively like-minded discussants. Yet, to date we lack sufficient means to measure viewpoint diversity in conversations. To this end, in this paper, we operationalize two viewpoint metrics proposed for recommender systems and adapt them to the context of social media conversations. This is the first study to apply these two metrics (Representation and Fragmentation) to real world data and to consider the implications for online conversations specifically. We apply these measures to two topics -- daylight savings time (DST), which serves as a control, and the more politically polarized topic of immigration. We find that the diversity scores for both Fragmentation and Representation are lower for immigration than for DST. Further, we find that while pro-immigrant views receive consistent pushback on the platform, anti-immigrant views largely operate within echo chambers. We observe less severe yet similar patterns for DST. Taken together, Representation and Fragmentation paint a meaningful and important new picture of viewpoint diversity.
translated by 谷歌翻译
We study critical systems that allocate scarce resources to satisfy basic needs, such as homeless services that provide housing. These systems often support communities disproportionately affected by systemic racial, gender, or other injustices, so it is crucial to design these systems with fairness considerations in mind. To address this problem, we propose a framework for evaluating fairness in contextual resource allocation systems that is inspired by fairness metrics in machine learning. This framework can be applied to evaluate the fairness properties of a historical policy, as well as to impose constraints in the design of new (counterfactual) allocation policies. Our work culminates with a set of incompatibility results that investigate the interplay between the different fairness metrics we propose. Notably, we demonstrate that: 1) fairness in allocation and fairness in outcomes are usually incompatible; 2) policies that prioritize based on a vulnerability score will usually result in unequal outcomes across groups, even if the score is perfectly calibrated; 3) policies using contextual information beyond what is needed to characterize baseline risk and treatment effects can be fairer in their outcomes than those using just baseline risk and treatment effects; and 4) policies using group status in addition to baseline risk and treatment effects are as fair as possible given all available information. Our framework can help guide the discussion among stakeholders in deciding which fairness metrics to impose when allocating scarce resources.
translated by 谷歌翻译
当呈现新任务时,人类可以在构图上推理。先前的研究表明,适当的提示技术使大型语言模型(LLM)能够解决人工构图概括任务,例如扫描。在这项工作中,我们在更现实的语义解析任务中确定了更大的词汇,并完善这些提示技术来解决这些挑战。我们的最佳方法是基于最小的提示:它使用基于提示的句法解析分解问题,然后使用此分解来选择适当的示例并顺序生成语义分析。这种方法使我们能够为CFQ设置新的最新技术,同时仅需要传统方法使用的培训数据的1%。由于我们的方法的一般性,我们希望类似的努力将在其他任务和领域中带来新的结果,尤其是对于知识密集型应用程序。
translated by 谷歌翻译
从图像中学习代表,健壮和歧视性信息对于有效的人重新识别(RE-ID)至关重要。在本文中,我们提出了一种基于身体和手部图像的人重新ID的端到端判别深度学习的复合方法。我们仔细设计了本地感知的全球注意力网络(Laga-Net),这是一个多分支深度网络架构,由一个用于空间注意力的分支组成,一个用于渠道注意。注意分支集中在图像的相关特征上,同时抑制了无关紧要的背景。为了克服注意力机制的弱点,与像素改组一样,我们将相对位置编码整合到空间注意模块中以捕获像素的空间位置。全球分支机构打算保留全球环境或结构信息。对于打算捕获细粒度信息的本地分支,我们进行统一的分区以水平在Conv-Layer上生成条纹。我们通过执行软分区来检索零件,而无需明确分区图像或需要外部线索,例如姿势估计。一组消融研究表明,每个组件都会有助于提高拉加网络的性能。对四个受欢迎的人体重新ID基准和两个公开可用的手数据集的广泛评估表明,我们的建议方法始终优于现有的最新方法。
translated by 谷歌翻译
秋季检测和分类成为医疗保健应用特殊性的不良问题,因为人口越来越老化。目前,大多数秋季化算法都提供二进制秋季或无效分类。为了获得更好的医疗保健,因此不足以进行二元秋季分类,而是将其扩展到多个秋季事件分类。在这项工作中,我们利用缓解人类骨架数据的隐私性进行多个秋季事件分类。从原始的RGB图像中提取了骨骼功能,不仅可以减轻个人隐私,还可以减少动态照明的影响。提出的秋季事件分类方法分为两个阶段。在第一阶段,该模型经过训练以实现二进制分类以滤除无腹部事件。然后,在第二阶段,对深神经网络(DNN)模型进行了训练,以进一步对五种类型的秋季事件进行分类。为了确认所提出的方法的效率,上下数据集上的实验优于最先进的实验。
translated by 谷歌翻译
在本文中,我们介绍了基于差异驱动器快照机器人和模拟的用户研究的基于倾斜的控制的实现,目的是将相同的功能带入真正的远程介绍机器人。参与者使用平衡板来控制机器人,并通过头部安装的显示器查看了虚拟环境。使用平衡板作为控制装置的主要动机源于虚拟现实(VR)疾病;即使是您自己的身体与屏幕上看到的动作相匹配的小动作也降低了视力和前庭器官之间的感觉冲突,这是大多数关于VR疾病发作的理论的核心。为了检验平衡委员会作为控制方法的假设比使用操纵杆要少可恶意,我们设计了一个用户研究(n = 32,15名女性),参与者在虚拟环境中驾驶模拟差异驱动器机器人, Nintendo Wii平衡板或操纵杆。但是,我们的预注册的主要假设不得到支持。操纵杆并没有使参与者引起更多的VR疾病,而委员会在统计学上的主观和客观性上都更加难以使用。分析开放式问题表明这些结果可能是有联系的,这意味着使用的困难似乎会影响疾病。即使在测试之前的无限训练时间也没有像熟悉的操纵杆那样容易使用。因此,使董事会更易于使用是启用其潜力的关键。我们为这个目标提供了一些可能性。
translated by 谷歌翻译
近年来,轨迹优化方法已在现实世界机器人上达到了出色的性能水平。这些方法在很大程度上依赖于动力学的准确分析模型,但是物理世界的某些方面只能在有限的程度上捕获。另一种方法是利用机器学习技术从数据中学习系统的可区分动力学模型。在这项工作中,我们使用轨迹优化和模型学习,在没有精确的动力学分析模型的情况下,使用机器人系统执行高度动态和复杂的任务。我们表明,从仅在两个不同的机器人上的25分钟相互作用的数据中收集的数据,神经网络可以准确地对高度非线性行为进行建模:(i)波士顿动力学点和(ii)RC CAR。此外,我们使用神经网络的梯度来执行基于梯度的轨迹优化。在我们的硬件实验中,我们证明了我们所学的模型可以代表现场和无线电控制(RC)汽车的复杂动力学,并与轨迹优化方法结合使用良好的性能。
translated by 谷歌翻译
本文考虑了使用户能够修改远程介绍机器人的路径的问题。该机器人能够自动导航到用户预定的目标,但是用户可能仍然希望修改路径,例如,远离其他人,或者更靠近她想在途中看到的地标。我们提出了人类影响的动态窗口方法(HI-DWA),这是一种基于动态窗口方法(DWA)的远程置换机器人的共享控制方法,该方法允许用户影响给予机器人的控制输入。为了验证所提出的方法,我们在虚拟现实(VR)中进行了用户研究(n = 32),以将HI-DWA与自主导航和手动控制之间的切换进行比较,以控制在虚拟环境中移动的模拟远程机器人。结果表明,用户使用HI-DWA控制器更快地实现了目标,并发现更容易使用。两种方法之间的偏好平均分配。定性分析表明,首选两种模式之间切换的参与者的主要原因是控制感。我们还分析了不同输入方法,操纵杆和手势,对偏好和感知工作量的影响。
translated by 谷歌翻译
现实世界中的时间序列数据集经常违反预测的标准监督学习的假设 - 它们的分布会随着时间的推移而发展,从而使传统的培训和模型选择程序均优化。在本文中,我们提出了一种新颖的方法,即自适应预测(SAF),以修改时间序列预测模型的培训,以通过此类非平稳时间序列数据提高其在预测任务上的性能。 SAF在基于“背景”的预测之前集成了自适应阶段,即在时间后退预测掩盖的输入。这是一种测试时间培训的形式,在执行预测任务之前,在测试样本上会在测试样本上创建一个自我监督的学习问题。通过这种方式,我们的方法可以有效地适应编码表示的分布,从而导致卓越的概括。 SAF可以与任何基于经典的编码器码头架构架构(例如经常性神经网络或基于注意力的体系结构)集成。关于众所周知,众所周知的非统计数据(例如医疗保健和金融)的域中的合成和现实数据集,我们证明了SAF在提高预测准确性方面具有重大好处。
translated by 谷歌翻译